Catégorisation automatique de textes basée sur des hiérarchies de concepts

نویسندگان

  • Jérôme Augé
  • Kurt Englmeier
  • Gilles Hubert
  • Josiane Mothe
چکیده

This paper deals with a method for automatic categorisation of texts according to concept hierarchies that describe a domain. This categorisation is based upon two principal components: – the definition of category representatives resulting from learning, – a voting mechanism in order to determine the most suitable categories for a given document. We evaluate the influence of different parameters on the results including the methods used to select the terms to be added to the category representation. The performances that have been obtained using the Reuters-21578 corpus are reported in this paper. MOTS-CLÉS : Recherche d'information, hiérarchies de concepts, catégorisation automatique.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Multi-catégorisation de textes juridiques et retour de pertinence

Résumé. La fouille de données textuelles constitue un champ majeur du traitement automatique des données. Une large variété de conférences, comme TREC, lui sont consacrées. Dans cette étude, nous nous intéressons à la fouille de textes juridiques, dans l’objectif est le classement automatique de ces textes. Nous utilisons des outils d’analyses linguistiques (extraction de terminologie) dans le ...

متن کامل

Construction et enrichissement automatique d'ontologie à partir de ressources externes

La construction automatique d’ontologies à partir de textes est généralement basée sur le texte proprement dit, et le domaine décrit est circonscrit au contenu du texte. Afin de concevoir des ontologies sémantiquement plus riches, nous proposons d’étendre les méthodes classiques en matière de construction d’ontologie (1) en prenant en compte le texte du point de vue de sa structure et de son co...

متن کامل

Analyse et structuration automatique des guides de bonnes pratiques cliniques : essai d'évaluation

Résumé : Les guides de bonnes pratiques cliniques (GBPC) sont des textes constitués de recommandations valides dont le but est de diffuser des synthèses de résultats démontrés et de normaliser des conduites à tenir dans des situations cliniques données. L’adhésion des médecins à ces guides doit conduire à une médecine de qualité basée sur des preuves scientifiques. Cet article présente un outil...

متن کامل

Une structure basée sur les hiérarchies pour synthétiser les itemsets fréquents extraits dans des fenêtres temporelles

Résumé. Le paradigme des flots de données rend impossible la conservation de l’intégralité de l’historique d’un flot qu’il faut alors résumer. L’extraction d’itemsets fréquents sur des fenêtres temporelles semble tout à fait adaptée mais l’amoncellement des résultats indépendants rend impossible l’exploitation de ces résultats. Nous proposons une structure basée sur les hiérarchies des données ...

متن کامل

Alignement extensionnel et asymétrique de hiérarchies conceptuelles par découverte d'implications entre concepts

Résumé. Dans la littérature, de nombreux travaux traitent de méthodes d’alignement d’ontologies. Ils utilisent, pour la plupart, des relations basées sur des mesures de similarité qui ont la particularité d’être symétriques. Cependant, peu de travaux évaluent l’intérêt d’utiliser des mesures d’appariement asymétriques dans le but d’enrichir l’alignement produit. Ainsi, nous proposons dans ce pa...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2003